AssignAdd ================= 将输入张量的值累加到输出张量中,实现张量原地加法操作。 .. math:: output_i = output_i + input_i 输入: - **input** - 输入数据地址。 - **output** - 输出数据地址(同时作为输入和输出)。 - **length** - 数组长度(元素个数)。 - **core_mask(int, 可选)** - 核掩码(仅适用于共享存储版本)。 输出: - **output** - 原地写回累加结果。 支持平台: ``FT78NE`` ``MT7004`` .. note:: - FT78NE 支持的数据类型:int8, int16, int32, fp32, fp64, cplx64, cplx128 - MT7004 支持的数据类型:fp16, fp32, int16, int32, cplx64 **共享存储版本:** .. c:function:: void i8_assignadd_s(int8_t* input, int8_t* output, int length, int core_mask) .. c:function:: void i16_assignadd_s(int16_t* input, int16_t* output, int length, int core_mask) .. c:function:: void i32_assignadd_s(int32_t* input, int32_t* output, int length, int core_mask) .. c:function:: void fp_assignadd_s(float* input, float* output, int length, int core_mask) .. c:function:: void dp_assignadd_s(double* input, double* output, int length, int core_mask) .. c:function:: void c64_assignadd_s(float* input, float* output, int length, int core_mask) .. c:function:: void c128_assignadd_s(double* input, double* output, int length, int core_mask) .. c:function:: void hp_assignadd_s(half* input, half* output, int length, int core_mask) **C调用示例:** .. code-block:: c :linenos: :emphasize-lines: 12 // FT78NE 多核示例 #include #include int main(int argc, char* argv[]) { float *input = (float *)0xA0000000; // input在DDR空间 float *output = (float *)0xB0000000; // output在DDR空间,同时作为输入和输出 int length = 1000; int core_mask = 0xff; // 执行 output[i] += input[i] fp_assignadd_s(input, output, length, core_mask); return 0; } **私有存储版本:** .. c:function:: void i8_assignadd_p(int8_t* input, int8_t* output, int length) .. c:function:: void i16_assignadd_p(int16_t* input, int16_t* output, int length) .. c:function:: void i32_assignadd_p(int32_t* input, int32_t* output, int length) .. c:function:: void fp_assignadd_p(float* input, float* output, int length) .. c:function:: void dp_assignadd_p(double* input, double* output, int length) .. c:function:: void c64_assignadd_p(float* input, float* output, int length) .. c:function:: void c128_assignadd_p(double* input, double* output, int length) .. c:function:: void hp_assignadd_p(half* input, half* output, int length) **C调用示例:** .. code-block:: c :linenos: :emphasize-lines: 11 // MT7004 单核示例 #include #include int main(int argc, char* argv[]) { half *input = (half *)0x10000000; // input在L2空间 half *output = (half *)0x10004000; // output在L2空间,同时作为输入和输出 int length = 1000; // 执行 output[i] += input[i] hp_assignadd_p(input, output, length); return 0; }